11. 使用可视化探索数据

使用可视化探索数据

使用下面的notebook 对你新结合的数据帧执行探索性数据分析。创建一些可视效果来回答notebook 下面的这些练习问题。

  • 根据此数据集中的列的直方图,以下哪个特征变量显示为右偏态? 固定酸度、总二氧化硫、pH 值、酒精度
  • 根据质量对不同特征变量的散点图,以下哪个最有可能对质量产生积极的影响?_挥发性酸度、残糖、pH 值、酒精度

notebook 文件名:用可视化工具进行探索性数据分析

Workspace

This section contains either a workspace (it can be a Jupyter Notebook workspace or an online code editor work space, etc.) and it cannot be automatically downloaded to be generated here. Please access the classroom with your account and manually download the workspace to your local machine. Note that for some courses, Udacity upload the workspace files onto https://github.com/udacity , so you may be able to download them there.

Workspace Information:

  • Default file path:
  • Workspace type: jupyter
  • Opened files (when workspace is loaded): n/a

根据这个数据集中的列的直方图,哪个特征变量出现右偏态?

SOLUTION:
  • 固定酸度
  • pH 值
  • 酒精度

根据质量对不同特征变量的散点图,以下哪个最有可能对质量产生积极的影响?

SOLUTION: 酒精度

现在,你已清理了你的数据并对其有了更多的了解,现在可以根据课程开头的练习中的问题得出结论了。为了对这些结论进行分析,让我们来了解一下你将要使用的 Pandas 中的两个有用函数 - groupby 和 query。